14 research outputs found

    Analyzing the Scope of Conditions in Texts: A Discourse-Based Approach

    Get PDF
    International audienceThis paper focuses on the task that consists in automatically structuring free texts according to semantic principles, hence requiring a discourse analysis. We show that the task can be rephrased as a machine learning task in which the algorithm is supposed to take an optimal decision from the range of complex interacting constraints. The approach is implemented and evaluated taking the example of Health Practices Guidelines, medium-size documents intended to describe common practices that should be followed by physicians. Our approach outperforms previous approaches limited to sentence boundaries or requiring a lot of manual work

    Automatically Restructuring Practice Guidelines using the GEM DTD

    Full text link
    This paper describes a system capable of semi-automatically filling an XML template from free texts in the clinical domain (practice guidelines). The XML template includes semantic information not explicitly encoded in the text (pairs of conditions and actions/recommendations). Therefore, there is a need to compute the exact scope of conditions over text sequences expressing the required actions. We present a system developed for this task. We show that it yields good performance when applied to the analysis of French practice guidelines

    Between browsing and search, a new model for navigating through large documents

    No full text
    International audienceThis paper proposes a new model for document access, which combines the search and browsing approaches. We define a good navigation as a navigation which is as quick and direct as possible and which offers good precision and recall rates in finding the text segments that are relevant for the user's information need. Our navigation model relies on recent advances in natural language processing and it is based on two traditional cognitive principles that are inherited from works on the visualization of information. This model is implemented in a navigation prototype which is designed for physicians who want to consult official recommendations to take medical decisions. Even if this model has not been really evaluated yet, we show the dynamicity and the efficiency of our approach on few detailled examples

    Analyse et structuration automatique des guides de bonnes pratiques cliniques : essai d'évaluation

    Get PDF
    National audienceHealth Practice Guideliens are supposed to unify practices and propose recommendations to physicians. This paper describes GemFrame, a system capable of semi-automatically filling an XML template from free texts in the clinical domain. The XML template includes semantic information not explicitly encoded in the text (pairs of conditions and ac-tions/recommendations). Therefore, there is a need to compute the exact scope of condi-tions over text sequences expressing the re-quired actions. We present a system developped for this task. We show that it yields good performance when applied to the analysis of French practice guidelines. We conclude with a precise evaluation of the tool.Les guides de bonnes pratiques cliniques (GBPC) sont des textes constitués de recommandations valides dont le but est de diffuser des synthèses de résultats démontrés et de normaliser des conduites à tenir dans des situations cliniques données. L'adhésion des médecins à ces guides doit conduire à une médecine de qualité basée sur des preuves scientifiques. Cet article présente un outil appelé GemFrame, destiné à faciliter la consultation des guides en proposant de nouveaux modes d'accès sur support électronique. Pour ce faire, un travail d'analyse et de structuration des GBPC est nécessaire. Nous présentons le système GemFrame, permettant cette structuration suite à une analyse semi-automatisée. Les GBPC étant des textes d'« incitation à l'action », ils sont principalement constitués de conditions et d'actions dépendant de ces conditions. Le système GemFrame vise à reconnaître automatiquement les segments « conditions » et les « segments incitation à l'action », puis à calculer la portée des conditions sur les actions. Nous présentons ici une évaluation détaillée sur plusieurs guides. Nous montrons d'abord l'intérêt de l'approche puis nous détaillons le processus d'évaluation fondé sur la comparaison des résultats obtenus automatiquement avec ceux obtenus manuellement (suite à l'élaboration de « référence »)

    Segmentation et structuration de textes procéduraux pour l'aide à la modélisation de connaissances : le rôle de la structure visuelle : Segmentation et structuration de textes procéduraux pour l'aide à la modélisation de connaissances : le rôle de la structure visuelle

    No full text
    Dans cet article, nous étudions le rôle de la structure visuelle pour la segmentation de textes procéduraux. Nous nous focalisons sur un type de textes procéduraux particulier : les Guides de Bonnes Pratiques médicales. Une étude linguistique effectuée sur ce corpus montre la pertinence ainsi que les limites des indices visuels, pour délimiter des ensembles conditions-actions, qui forment des unités sémantiques de base pour la segmentation. Cette étude a permis de définir une architecture modulaire qui exploite ces indices pour segmenter et structurer les textes

    Restructuring documents: A discourse based approach

    No full text
    International audienc

    Analyse discursive automatique de texte (application à la modélisation des connaissances)

    No full text
    Les systèmes d'analyse sémantique reposent le plus souvent sur des analyses locales du texte tandis qu'il devient de plus en plus évident que la structure du texte fait sens et doit être exploitée pour fournir un meilleur accès au contenu des documents. Notre travail s'inscrit dans un cadre applicatif précis, garant d'une évaluation solide, dans le domaine médical : la modélisation des Guides de Bonnes Pratiques. Les guides sont des textes de recommandation médicales écrits par des autorités en matière de santé et adressés aux médecins afin d'uniformiser les pratiques thérapeutiques. Ces document étant peu exploités par les médecins, un effort spécifique a été fait pour construire des outils informatiques permettant de faciliter l'accès aux guides. Pour alimenter ces outils, les textes ont besoin d'être modélisés. Nous proposons l'application GemFrame permettant de fournir automatiquement une représentation structurée des textes. Elle vise à extraire les segments expriment une recommandation et ceux exprimant une condition puis associer à chaque segment "condition" l'ensemble des segments "recommandation" qui dépendent de cette condition. Les relations de dependances s'établissent souvent au delà du niveau de la phrase, ce qui signifie le recours à une approche textuelle. Nous proposons une stratégie basée sur l'exploitation de connaisances linguistiques obtenues par une methode originale liant observation linguistique et apprentissage artificiel. Le système a étè validé sur trois aspects complémentaires: utilité, performance et pertinence de la méthode.NPL is mainly focused on words and sentences even if most people agree that a better understanding of text structure could help extract kowledge. In this thesis, we show that, in certain domains, textual approaches are relevant for NLP, taking as an exampe a specific task related to the medical domain : the automatic modelling of health practice guidelines. Clinical Guidelines are legal documents providing an aid for physicists in their diagnosis and treatment tasks. Because these recommendations are not really followed, there is a need for electronic tools that facilitate the access to these documents. Our system, GemFrame, is capable of automatically structure Health Practice Guidelies by recognizing conditions and recommandations and computing the relations between these two kinds of segments. We have showed that these relations involve large parts of texts, beyond the sentence barrier, that justify a textual approach. Wer propose a strategy based on the recognition of linguistic features acquired by an original method that links linguistic observation and machine learning. The system has been fully validated on three complementary aspects: usefulness, performances and relevance of the methodPARIS13-BU Sciences (930792102) / SudocSudocFranceF

    A MINE alternative to D-optimal designs for the linear model.

    No full text
    Doing large-scale genomics experiments can be expensive, and so experimenters want to get the most information out of each experiment. To this end the Maximally Informative Next Experiment (MINE) criterion for experimental design was developed. Here we explore this idea in a simplified context, the linear model. Four variations of the MINE method for the linear model were created: MINE-like, MINE, MINE with random orthonormal basis, and MINE with random rotation. Each method varies in how it maximizes the MINE criterion. Theorem 1 establishes sufficient conditions for the maximization of the MINE criterion under the linear model. Theorem 2 establishes when the MINE criterion is equivalent to the classic design criterion of D-optimality. By simulation under the linear model, we establish that the MINE with random orthonormal basis and MINE with random rotation are faster to discover the true linear relation with p regression coefficients and n observations when p>>n. We also establish in simulations with n<100, p=1000, σ=0.01 and 1000 replicates that these two variations of MINE also display a lower false positive rate than the MINE-like method and additionally, for a majority of the experiments, for the MINE method

    Parameters for simulations.

    No full text
    <p>Parameters for simulations.</p

    The number of false positives as a function of the number of experiments.

    No full text
    <p>These numbers are averaged over all 1000 simulations for each method. Blue corresponds to MINE-like, red to MINE, green to MINE with random orthonormal basis, and purple to MINE with random rotation. The final two overlap almost exactly which is why the green line is not visible.</p
    corecore